Matryoshka Diffusion Models
https://gyazo.com/fb29ede54f08c447e3fd70291d994934
Apple(!)によるこの論文では、解像度のアップサンプリング/ダウンサンプリングが拡散プロセスの一部である多重解像度拡散モデルを学習する。この目的のために特別なNestedUnetアーキテクチャを導入している。より効率的な学習のために、漸進的な解像度の学習スケジュールを採用している。彼らは、潜在拡散や単純拡散のような主要な手法と遜色のない結果を得ている。彼らの手法はビデオ生成にも有効である。 複数の解像度で同時に拡散プロセスを行う
https://gyazo.com/9069f6a0e545fe47ca6c2409b7130efc
それぞれの解像度で独立してDenoisingを行う
低解像度の生成結果が高解像度の生成に寄与する
NestedUNet
https://gyazo.com/b52e34758b0b4604605d68fe1b603e76